科目名 □音声・画像/処理・理解
担当教員   一ノ瀬 裕     
対象学年   3年   クラス   [411]  
講義室   12106教室   開講学期   後期  
曜日・時限   水2   単位区分   必,選択  
授業形態     単位数   2  
準備事項    
備考    

講義概要/Class Outline

人間同士で情報を伝達するために文字と並んで重要な役割を演ずるのが音声と画像である。音声は意思を伝える目的で能動的に発する情報であるが、画像は自然界に存在するものが多い、という相違がある。この講義では、音声について合成、認識などの基礎的な内容を学ぶ。また、自然画像が自然に露呈する情報を抽出するのが画像理解であり、そのためには画像処理と画像認識の技術が欠かせないことから、画像処理と画像認識の基本と具体例を学ぶ。さらに、音声・画像は、その担う情報に比べてデータ量が非常に多いという性質があり、本質を損なうことなくデータ量を減らす手法についても学ぶ。  

講義計画 /Class Structure

内容
1 概要、画像のディジタル表現、画像認識のプロセス
履修の心構え、講義概要、画像のディジタル表現(2値画像、濃淡画像、カラー画像、画像の効率よい表現)、画像認識のプロセス(観測、画像処理、特徴抽出、識別・判定、学習)
2 画像処理(1)
画像処理(空間フィルタリング)のモデルとその基本操作
3 画像処理(2)
雑音除去・平滑化、画像強調・辺縁(エッジ)抽出への適用
4 画像の特徴抽出
形状特徴量(面積、平均太さ、円形度、連結成分数)、濃度特徴量(平均濃度値、分散値、周波数値、濃度共起行列)
5 画像の識別・判定
最短距離識別法、類似度法、統計的識別法
6 学習識別法
ニューラルネットワークによる学習識別法、画像認識の事例紹介
7 画像の処理・理解のまとめと中間試験
第1回〜第6回のまとめ、第1回〜第6回の内容に関する中間試験
8 音声生成機構
音声の物理的生成機構、音声の特徴・分類
9 音のディジタル表現
標本化・量子化、標本化定理、音・音声のデータ量
10 音のディジタル処理(1)
三角関数の積分、フーリエ級数展開の例(1)
11 音のディジタル処理(2)
フーリエ級数展開の例(2)
12 音声圧縮
音声符号化方式
13 音声合成
編集方式、規則合成方式
14 音声認識、音声の処理・理解のまとめ
単語音声認識、会話音声認識、第8回〜第14回のまとめ
 

学習・教育目標/Class Target 1. 音声についての基礎的な事項を知っている。
2. 音声の効率良い表現についての基礎的な事項を知っている。
3. 音声合成、音声認識の原理についての基礎的な事項を知っている。
4. 画像についての基礎的な事項を知っている。
5. 画像処理、画像認識の原理についての基礎的な事項を知っている。
6. 画像認識の各プロセスについての基礎的な事項を知っている。  
評価基準/GradingCriteria 総合点でつぎのように評価する。 ・ 秀:90点以上 ・ 優:80点以上 ・ 良:70点以上 ・ 可:60点以上  
評価方法/GradingMethod 学習・教育目標1〜3は音声の処理・理解に関する期末試験(43点)と毎回の小テスト/演習(7点)により評価し、学習・教育目標4〜6は画像の処理・理解に関する第7回目の中間試験(44点)と毎回の演習(6点)により評価する。  
受講上の注意/Class Rules 講義の順番・内容は進捗状況などにより変更することがある。  
受講制限/Prerequisit  
関連する科目/Related Class 信号処理、ヒューマンインタフェース、マルチメディア  
教科書/Text
著者名  
著書名  
出版社名  
ISBNコード  
指定図書/Assigned Books
著者名 板橋 秀一  
著書名 音声工学  
出版社名 森北出版  
ISBNコード 978-4-6278-2811-7  
著者名 酒井 幸市  
著書名 ディジタル画像処理の基礎と応用  
出版社名 CQ出版  
ISBNコード 978-4-7898-3095-9  
参考文献/Bibliography
著者名  
著書名  
>出版社名  
ISBNコード